Forum
>>
Programmazione Python
>>
Web e Reti
>>
ricerca immagini
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
Scritto da Lime_In_The_Coconut |
2017-01-19 22:10:51 - ricerca immagini
|
Ciao a tutti,
sto scrivendo un programma che, data una lista di url, per ciascun url ne estrae le immagini. il problema è che non riesco a tirare fuori tutte le immagini da alcuni siti web. il codice è il seguente: dict={} lista=[] for url in url_list: r = requests.Session() html = r.get(url) soup = bs4.BeautifulSoup(html.content, "html5lib") if re.search(pattern,soup.get_text()): continue for img in soup.find_all(name="img"): src = img.get("src") lista.append(src) dict = lista lista = [] il problema ad esempio è che per l'url: http://www.morguefile.com/search/morguefile/1/yoga/pop ricevo il seguente output: http://www.morguefile.com/search/morguefile/1/yoga/pop ['/img/icon_search.svg', '/img/icon_quest.png', '/img/icon_search_close.svg', '/img/prm/iStock_white.png', '/img/icon_sort.svg', '/img/prm/iStock_white.png', '/img/prm/iStock_white.png', '/img/prm/istockclosePopup.png', '/img/prm/iStock ByGI TM white.png'] Non riesco a capire perchè.. analizzando la pagina ci sono molti tag img e questi non vengono catturati.. --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:13:05 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:14:43 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:14:53 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:15:40 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:15:56 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:38:00 --- --- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:38:41 --- |
Pagina: 1
Esegui il login per scrivere una risposta.